【Day 06】RNN學習筆記 Part II

第 11 屆 iThome 鐵人賽

DAY 6

Google Developers Machine Learning

我是高中生，我學ML和NLP系列第 6 篇

11th鐵人賽 rnn

skyhong2002

2019-09-19 23:32:40

1129 瀏覽

分享至

RNN的特點在於輸出除了被當下的input影響外，之前input的東西也會被記憶在hidden layer的參數內，利用此參數可以記憶之前Input的內容，再將其輸入到下一次Input中的同一個hidden layer參數。

可以發現除了一個一個的資料本身以外，資料的先後順序也會影響到最後的Output。畢盡我們的文法本來就會照著先後順序說，我們在理解一個句子的時候也會看看上下文去理解句子的意思。

其實Recurrent Neurel Netowrk的基本概念僅此，如果看不懂也無仿，只要知道重點是RNN會多看資料的先後順序及關係影響最後的輸出就好了。

（這張投影片的意思是你可以堆很多很多層hidden layer，好多好爽好慢QQ）

資料儲存類型

Recurrent Neurel Netowrk的變形有Elman Network和Jorden Network：

Elman Network

把hidden layer的值在前面存起來，下一個時間點再丟進去同一個hidden layer中。

Jorden Network

此方法存的是整個經過hidden layer的結果存進去memory中，所以每次儲存前都會跑一次函式。

Jorden Network因為有Output的目標，所以Jorden Network的成效正常情況下會比Elman Network還要高。

Bidirectional RNN

我們在看一段文字的時候雖然接收的次序是從前到後，但有時候要聽到後面的意思才會了解前面的語意。將此概念套入RNN中的話，可以看成我們將整個Input都看過一遍的情況下，輸出每個單獨Input經不同參數的hidden layer的加總。

Long Short-term Memory

以上都是以最基本的RNN延伸出的模型，但其實看到這裡可能會覺得很奇怪，因為如果前面的資料已經跑過去很多時，Output的值可能會越來越大，或者是每個hidden layer能夠參考的記憶只有上一個資料。於是Long Short-term Memory可以將這些問題都解決。

請把 dash 放在 Short 和 term 中，原本的Short-term Memory只能記住上一個資料，而LSTM只要不把Forget get關掉就可以讓資料一直傳遞下去。 - 李宏毅

【Day 05】RNN學習筆記 Part I

【Day 07】RNN學習筆記 Part III

系列文

我是高中生，我學ML和NLP 共 20 篇

RSS系列文訂閱系列文

5 人訂閱

完整目錄

直播研討會

{{ item.channelVendor }} {{ item.webinarstarted }} |

直播中

尚未有邦友留言

立即登入留言

參賽組數

1064 組

團體組數

40 組

累計文章數

22207 篇

完賽人數

600 人

15th鐵人賽 16th鐵人賽 13th鐵人賽 14th鐵人賽 12th鐵人賽 11th鐵人賽鐵人賽 2019鐵人賽 javascript 2018鐵人賽 python 2017鐵人賽 windows php c# windows server linux css react vue.js

IT邦幫忙

我是高中生，我學ML和NLP系列 第 6 篇